Un modelo de lenguaje grande puede generar lenguaje con fluidez, pero la fluidez no es lo mismo que la fiabilidad factual. La limitación fundamental de un modelo de lenguaje es su dependencia de memoria paramétrica—conocimiento congelado en el tiempo en el momento en que terminó el entrenamiento, conocido como el corte de entrenamiento.
Por qué los modelos de lenguaje fallan aislados
RAG existe porque muchas preguntas prácticas dependen de información que es privada, reciente, versionada, específica del dominio, o auditada. Sin conocimiento externo, el modelo sufre de:
- Limitación Temporal: Incapacidad para conocer eventos posteriores al entrenamiento.
- Limitación de Acceso: Sin visibilidad sobre los "datos oscuros" (documentos privados de empresas).
- Limitación de Rastreabilidad: Falta de una huella auditada para la responsabilidad profesional.
El Paradigma del Libro Abierto
En lugar de obligar al modelo a 'recordar' todo mediante un reentrenamiento costoso, cambiamos la arquitectura para recuperar primero evidencia específica desde un corpus externo, permitiendo al modelo responder con esa evidencia a la vista. Esto proporciona confianza con evidencia más que confianza sin ella.